max length | sentence |
---|---|
5 | Belgisch Congo wordt Republiek Congo, daarna Zaïre. |
5 | Binnenlandse Zaken ondersteunt conserveringstechniekenBinnenlandse Zaken ondersteunt conserveringstechnieken. |
5 | Herontwikkelingsobject (grote verbouwing). |
5 | Intussen zitten beide bedrijven zonder leiding. |
5 | Leren: individueel (huiswerk) * Zelfstandig werken. |
4 | Aanvraag extra diensten voor standaard telefoonaansluiting. |
4 | Barça greep vorig jaar naast alle prijzen. |
4 | Bijvoorbeeld wanneer iets politiek heel gevoelig ligt. |
4 | Brokopondo kent honderd procent gezinslandbouw. |
4 | Daarbij zijn twee waarschuwingsschoten gelost. |
4 | Daar laat Santokhi geen twijfel over bestaan. |
4 | Deze cijfers werden vrijdag gepresenteerd. |
4 | Deze reglementen zijn door IATA opgesteld. |
4 | Deze situatie moet dringend aangepakt worden. |
4 | Deze Westafrikaanse republiek wordt geleid door President Kwame Nkrumah. |
4 | Drie omstanders werden door recochet hagels geraakt. |
4 | Ernest Grep voorzitter Stichting Collectief Overzee Suriname. |
4 | Hierover heeft parlementarier Asiskoemar Gayadin zijn beklag gedaan. |
4 | Hiervoor zijn drie potentiele financierde bereid. |
4 | Logisch want solidariteit laat zich niet afdwingen. |
4 | Mogelijk beschikt justitie over beeldmateriaal. |
4 | Ondanks herhaalde verzoeken wilde Seedorf niet reageren, aldus Trouw. |
4 | Ondanks zijn bliksemcarrière blijft Pichai bescheiden. |
4 | Rickie Ristie doet verslag vaniot Nickerie. |
4 | Rock & Roll pionier Buddy Holly’s eerste single “Blue Days, Black Nights” wordt uitgegeven. |
4 | Veiligheidsnormen worden veelvuldig niet nageleefd. |
4 | Volwassenen worden meestal niet ernstig ziek. |
4 | Waar moet Artiestenbelasting gestort/ betaald worden? |
4 | Wanneer worden mijn bonusminuten bijgeboekt? |
3 | Aan deze instelling wordt een subsidie gegeven van ruim SRD 120 miljoen. |
In this subsection, we order the sentences by the length of the shortest word an look for the sentences with the largest values. As explained in subsection 4.5.2.3, we expect to find non-typical sentences.
select min(char_length(word)) as a, s.sentence from sentences s, inv_w i, words w where s.s_id=i.s_id and i.w_id=w.w_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by a desc limit 30;
4.5.2.1 Maximum word rank in sentence
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.8 Sentences consisting of long words only II